AI资讯新闻榜单内容搜索- DeepSeek

DeepSeek、GPT-5带头转向混合推理，一个token也不能浪费

在最近的一档脱口秀节目中，演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI，连个「1 加 1 等于几」都要斟酌半天。

来自主题: AI资讯

7534 点击 2025-08-31 13:17

前些天，DeepSeek 在发布 DeepSeek V3.1 的文章评论区中，提及了 UE8M0 FP8 的量化设计，声称是针对即将发布的下一代国产芯片设计。

来自主题: AI资讯

8796 点击 2025-08-28 15:40

一早起来，看到群里炸了锅！主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈，该模型在生成文本时，会毫无征兆地随机插入“极”这个汉字（繁体简体都会）

来自主题: AI资讯

10021 点击 2025-08-26 10:14

今天下午，DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知，今天新增了模型升级点、榜单成绩、model card，huggingface 上现在也可以下载模型文件了。

来自主题: AI资讯

9112 点击 2025-08-22 18:13

在大语言模型的竞争中，数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练，到 DeepSeek 提出 GRPO 算法，我们见证了强化学习在推理模型领域的巨大潜力。

来自主题: AI技术研报

8118 点击 2025-08-22 17:23

软件+硬件的全链路国产 AI 体系来了？这几天，不论国内国外，人们都在关注 DeepSeek 发布的 V3.1 新模型。

来自主题: AI资讯

8075 点击 2025-08-22 15:55

这就是我与 HMD 3210 的奇遇记：一台外表是 30 年前诺基亚、内心却住着一个完整大模型的「时光机器」。

来自主题: AI资讯

8635 点击 2025-08-11 11:42

2025 年已过半，今年的大模型热度明显下降，关于基础模型的关注大多收敛到了 DeepSeek 与阿里通义上。相比之下，曾一度被标榜为大模型“国产替代”、信创之光的智谱 AI 所受到的关注度明显下降，过往高调的战略打法也渐显低迷。

来自主题: AI资讯

8329 点击 2025-08-04 20:18

仅靠提示词优化就能超越 DeepSeek 开发的 GRPO 强化学习算法？是的，你没有看错。近日上线 arXiv 的一篇论文正是凭此吸引了无数眼球。

来自主题: AI技术研报

7986 点击 2025-08-01 11:42

Kimi 又火了，在 DeepSeek 的热闹中沉寂大半年后，Kimi K2 悄悄在 LMArena 竞技场中从 DeepSeek 手中，夺过了全球开源第一的宝座。

来自主题: AI资讯

9619 点击 2025-07-21 12:05